23 research outputs found

    Machine virtuelle universelle pour codage vidéo reconfigurable

    Get PDF
    Cette thèse propose un nouveau paradigme de représentation d applications pour les machines virtuelles, capable d abstraire l architecture des systèmes informatiques. Les machines virtuelles actuelles reposent sur un modèle unique de représentation d application qui abstrait les instructions des machines et sur un modèle d exécution qui traduit le fonctionnement de ces instructions vers les machines cibles. S ils sont capables de rendre les applications portables sur une vaste gamme de systèmes, ces deux modèles ne permettent pas en revanche d exprimer la concurrence sur les instructions. Or, celle-ci est indispensable pour optimiser le traitement des applications selon les ressources disponibles de la plate-forme cible. Nous avons tout d abord développé une représentation universelle d applications pour machine virtuelle fondée sur la modélisation par graphe flux de données. Une application est ainsi modélisée par un graphe orienté dont les sommets sont des unités de calcul (les acteurs) et dont les arcs représentent le flux de données passant au travers de ces sommets. Chaque unité de calcul peut être traitée indépendamment des autres sur des ressources distinctes. La concurrence sur les instructions dans l application est alors explicite. Exploiter ce nouveau formalisme de description d'applications nécessite de modifier les règles de programmation. A cette fin, nous avons introduit et défini le concept de Représentation Canonique et Minimale d acteur. Il se fonde à la fois sur le langage de programmation orienté acteur CAL et sur les modèles d abstraction d instructions des machines virtuelles existantes. Notre contribution majeure qui intègre les deux nouvelles représentations proposées, est le développement d une Machine Virtuelle Universelle (MVU) dont la spécificité est de gérer les mécanismes d adaptation, d optimisation et d ordonnancement à partir de l infrastructure de compilation Low-Level Virtual Machine. La pertinence de cette MVU est démontrée dans le contexte normatif du codage vidéo reconfigurable (RVC). En effet, MPEG RVC fournit des applications de référence de décodeurs conformes à la norme MPEG-4 partie 2 Simple Profile sous la forme de graphe flux de données. L une des applications de cette thèse est la modélisation par graphe flux de données d un décodeur conforme à la norme MPEG-4 partie 10 Constrained Baseline Profile qui est deux fois plus complexe que les applications de référence MPEG RVC. Les résultats expérimentaux montrent un gain en performance en exécution de deux pour des plates-formes dotées de deux cœurs par rapport à une exécution mono-cœur. Les optimisations développées aboutissent à un gain de 25% sur ces performances pour des temps de compilation diminués de moitié. Les travaux effectués démontrent le caractère opérationnel et universel de cette norme dont le cadre d utilisation dépasse le domaine vidéo pour s appliquer à d autres domaine de traitement du signal (3D, son, photo )This thesis proposes a new paradigm that abstracts the architecture of computer systems for representing virtual machines applications. Current applications are based on abstraction of machine s instructions and on an execution model that reflects operations of these instructions on the target machine. While these two models are efficient to make applications portable across a wide range of systems, they do not express concurrency between instructions. Expressing concurrency is yet essential to optimize processing of application as the number of processing units is increasing in computer systems. We first develop a universal representation of applications for virtual machines based on dataflow graph modeling. Thus, an application is modeled by a directed graph where vertices are computation units (the actors) and edges represent the flow of data between vertices. Each processing units can be treated apart independently on separate resources. Concurrency in the instructions is then made explicitly. Exploit this new description formalism of applications requires a change in programming rules. To that purpose, we introduce and define a Minimal and Canonical Representation of actors. It is both based on actor-oriented programming and on instructions abstraction used in existing Virtual Machines. Our major contribution, which incorporates the two new representations proposed, is the development of a Universal Virtual Machine (UVM) for managing specific mechanisms of adaptation, optimization and scheduling based on the Low-Level Virtual Machine (LLVM) infrastructure. The relevance of the MVU is demonstrated on the MPEG Reconfigurable Video Coding standard. In fact, MPEG RVC provides decoder s reference application compliant with the MPEG-4 part 2 Simple Profile in the form of dataflow graph. One application of this thesis is a new dataflow description of a decoder compliant with the MPEG-4 part 10 Constrained Baseline Profile, which is twice as complex as the reference MPEG RVC application. Experimental results show a gain in performance close to double on a two cores compare to a single core execution. Developed optimizations result in a gain on performance of 25% for compile times reduced by half. The work developed demonstrates the operational nature of this standard and offers a universal framework which exceeds the field of video domain (3D, sound, picture...)EVRY-INT (912282302) / SudocSudocFranceF

    MĂ©thodes de tatouage robuste pour la protection de l imagerie numerique 3D

    Get PDF
    La multiplication des contenus stéréoscopique augmente les risques de piratage numérique. La solution technologique par tatouage relève ce défi. En pratique, le défi d une approche de tatouage est d'atteindre l équilibre fonctionnel entre la transparence, la robustesse, la quantité d information insérée et le coût de calcul. Tandis que la capture et l'affichage du contenu 3D ne sont fondées que sur les deux vues gauche/droite, des représentations alternatives, comme les cartes de disparité devrait également être envisagée lors de la transmission/stockage. Une étude spécifique sur le domaine d insertion optimale devient alors nécessaire. Cette thèse aborde les défis mentionnés ci-dessus. Tout d'abord, une nouvelle carte de disparité (3D video-New Three Step Search- 3DV-SNSL) est développée. Les performances des 3DV-NTSS ont été évaluées en termes de qualité visuelle de l'image reconstruite et coût de calcul. En comparaison avec l'état de l'art (NTSS et FS-MPEG) des gains moyens de 2dB en PSNR et 0,1 en SSIM sont obtenus. Le coût de calcul est réduit par un facteur moyen entre 1,3 et 13. Deuxièmement, une étude comparative sur les principales classes héritées des méthodes de tatouage 2D et de leurs domaines d'insertion optimales connexes est effectuée. Quatre méthodes d'insertion appartenant aux familles SS, SI et hybride (Fast-IProtect) sont considérées. Les expériences ont mis en évidence que Fast-IProtect effectué dans la nouvelle carte de disparité (3DV-NTSS) serait suffisamment générique afin de servir une grande variété d'applications. La pertinence statistique des résultats est donnée par les limites de confiance de 95% et leurs erreurs relatives inférieurs er <0.1The explosion in stereoscopic video distribution increases the concerns over its copyright protection. Watermarking can be considered as the most flexible property right protection technology. The watermarking applicative issue is to reach the trade-off between the properties of transparency, robustness, data payload and computational cost. While the capturing and displaying of the 3D content are solely based on the two left/right views, some alternative representations, like the disparity maps should also be considered during transmission/storage. A specific study on the optimal (with respect to the above-mentioned properties) insertion domain is also required. The present thesis tackles the above-mentioned challenges. First, a new disparity map (3D video-New Three Step Search - 3DV-NTSS) is designed. The performances of the 3DV-NTSS were evaluated in terms of visual quality of the reconstructed image and computational cost. When compared with state of the art methods (NTSS and FS-MPEG) average gains of 2dB in PSNR and 0.1 in SSIM are obtained. The computational cost is reduced by average factors between 1.3 and 13. Second, a comparative study on the main classes of 2D inherited watermarking methods and on their related optimal insertion domains is carried out. Four insertion methods are considered; they belong to the SS, SI and hybrid (Fast-IProtect) families. The experiments brought to light that the Fast-IProtect performed in the new disparity map domain (3DV-NTSS) would be generic enough so as to serve a large variety of applications. The statistical relevance of the results is given by the 95% confidence limits and their underlying relative errors lower than er<0.1EVRY-INT (912282302) / SudocSudocFranceF

    Approches orientées modèle pour la capture des mouvements du visage en vision par ordinateur

    No full text
    Recalage de visage et caractérisation d'expression faciale à partir de séquences vidéos ont suscité ces dernières années de nombreuses recherches dans le cadre d'applications référencées vision. Si le système visuel humain permet de localiser spontanément un visage et ses principales composantes, et de différencier les expressions faciales, ces mêmes tâches transposées dans le cadre de la vision par ordinateur restent des sujets ouverts. L'approche classique mettant en oeuvre un modèle 3D pour analyser des séquences vidéos faciales comporte deux étapes de difficulté croissante : une adaptation globale de la pose du modèle et une adaptation locale de la forme du modèle. Dans ce contexte, nous proposons une méthode robuste d'estimation de la pose 3D globale de la tête dans des séquences vidéos acquises dans un contexte réaliste. La démarche adoptée consiste en une mise en correspondance de primitives 3D du modèle (géométrie, indice de visibilité) avec des primitives 3D extraites des images (mouvement, texture) par minimisation d'une fonctionnelle relativement aux paramètres 3D de pose. Concernant la capture des mouvements non rigides du visage, nous avons développé une méthode de recalage par prototypes déformables pour le suivi des parties du visage les plus expressives dans une communication (bouche, yeux). Les prototypes déformables associés aux éléments faciaux d'intérêt sont modélisés par des B-spines interpolant les paramètres MPEG-4 de définistion du visage...During the last years, face tracking and facial expression characterisation in video sequences have motivated intensive research in the field of computer vision. Although intuitive for humans, locating faces and facial components and distinguishing between various facial expressions in video sequences remains today a widely open issus in computer vision. The most common approach for 3D model-based analysis of facial image sequences involve two steps of increasing difficulty, namely : 1) global 3D model pose adaptation and 2) local model shape adaptation. Within this context, we propose a method for 3D model-based head tracking in video sequences acquired in realistic conditions. The proposed approach relies on the matching between 3D model features (geometry, visibility index) and 2D image features estimated throughout the sequence (motion, texture). The maching is performed by minimizing a cost function with respect to the 3D pose parameters....PARIS5-BU Saints-Pères (751062109) / SudocSudocFranceF

    Modélisation in-silico des voies aériennes (reconstruction morphologique et simulation fonctionnelle)

    No full text
    Dans les nouveaux protocoles thérapeutiques par voie inhalée, le dosage des particules actives reste un problème complexe qui dépend de trois principaux facteurs : leur taille, la dynamique des flux et les variations de calibre bronchique. Contribuant au projet RNTS RMOD, la recherche développée dans cette thèse propose une modélisation in-silico de la structure des voies aériennes supérieures (VAS) et proximales (VAP) à partir d examens tomodensitométriques. La modélisation développée fait coopérer des méthodes originales de segmentation des images, de construction de surface maillée et d analyse morphofonctionnelle. Une modélisation unifiée des VAP et VAS est obtenue pour la première fois. Elle démontre la pertinence des approches développées, ouvrant la voie aux études fonctionnelles prenant en compte les paramètres morphologiques susceptibles d influer localement ou globalement sur la dynamique des écoulements.In the new therapeutic protocols by inhalation, dosing the actives particles is still a complex issue which depends on three main parameters : the size, the fluid dynamics and the bronchial calibre variations. As a contribution of the RNTs project RMOD, the research developed in this thesis proposes an in-silico modelisation of the Upper Airwavs (UAw) and Proximal Airways (Paw) structure from computer tomography data. The developed modelisation uses original methods for image segmentation, meshed surface construction and morphofonctional analysis. A unified modelisation of the Uaw and Paw is obtained for the first time. It shows the pertinence of the developed approach, leading to functional studies which takes into account the morphological parameters influencing locally or globally on the fluid dynamics.PARIS5-BU Saints-Pères (751062109) / SudocSudocFranceF

    Analyse multi-vues d'objets 3D pour interactions collaboratives

    No full text
    The objective of this thesis is the 3D reconstruction of real objects for collaborative interactions. Within this framework, the goal is to reconstruct an object from a small number of calibrated views (8 to 12 images), and then insert the obtained numerical models into shared collaborative environments for further visualization and manipulation. The thesis is organized as follows. First, in the general introduction, we introduce the context of the research presented in this work. We present the acquisition system developed within our laboratory, and show the relationship between the calibration of this system, the image acquisition process, and the collaborative interactions with the reconstructed objects. Then, in a first chapter, we present some aspects of 3D geometry applied to computer vision. We present the projective geometry theory, the classical linear and non-linear camera models, and some stereoscopic vision results useful for the rest of the document. The second chapter is dedicated to the issue of camera calibration. After a state-of-the-art of camera calibration methods, we propose a robust camera calibration method based on the robust estimation of the perspective projection matrix. The calibration pattern used is a cube with faces of different colours. The proposed calibration algorithm uses one image per camera to perform the calibration. However, in order to increase the accuracy of the camera parameters estimation, multiple images can also be used. Our method yields a robust estimation of the camera parameters while minimizing the amount of user interaction requested. In order to validate the method, we introduce a set of new objective criteria for evaluation and comparison of camera calibration methods. The proposed criteria are based on rectification and 3D reconstruction of an unknown coplanar point set, a virtual pattern, and the re-estimation of the known parameters of stereoscopic systems. Our calibration method is finally validated according to the proposed criteria. The third chapter3D tackles the issue of 3D reconstruction of real objects . After a comprehensive state-of-the-art of 3D reconstruction methods, we present our proposed multiresolutiuon 3D reconstruction algorithm, which is adapted to collaborative interaction tasks. Our contributions specifically concern new algorithms for voxel visibility and photo-consistency estimation. The proposed 3D reconstruction method is then tested and validated upon a set of images of real objects from existing benchmark databases. The fourth chapter handles the collaborative interactions with 3D objects. First, the calibration of our acquisition system composed of eight cameras is presented. Experimental results concerning 3D reconstruction of objects available in our laboratory are then presented. Finally, collaborative interactions with the reconstructed objects are illustrated within the framework of three existing interfaces in the France Telecom R\&D laboratories: MOWGLI, DigiTable and Spin3D. A concluding section summarizes the contributions of this thesis and opens perspectives of future work.EVRY-INT (912282302) / SudocEVRY-BU (912282101) / SudocSudocFranceF

    Modélisation et animation intéractive de visages virtuels de dessins animés

    No full text
    La production de dessins animés 2D qui suit un schéma mis en place dans les années 1920 fait intervenir un très grand nombre de compétences différentes. Par opposition à ce mode de travail traditionnel, la production de films de synthèse 3D, en exploitant des technologies et des outils les plus récents, devient intéressante en termes de temps et coûts de fabrication. Dans ce contexte compétitif, cette thèse a pour objectif de contribuer au développement d'une plate-forme de reconstruction, déformation et animation de modèles 3D de visages pour les dessins animés 2D. Nos contributions ont porté sur l'élaboration d'une méthode de conception de visages virtuels 3D à partir d'une part d'un modèle 3D et d'autre part d'un ensemble de dessins 2D représentant les caractéristiques faciales, la mise au point d'une procédure de création de poses clés, utilisant plusieurs méthodes de déformation non-rigide et la conception d'un module d'animation 3D compatible avec le standard MPEG-4/AFX.The production of 2D cartoons that follows a pattern established in the 1920 involves a very large number of different skills. In contrast to this traditional way, the production of 3D films, using the most recent technology and tools, becomes interesting in terms of time and manufacturing costs. In this competitive context, this thesis aims to contribute to development a platform reconstruction, deformation and animation of 3D models faces for 2D cartoons. Our contributions have focused on the development of a methodology to create 3D virtual faces from a 3D model and a set of 2D drawings representing facial features, the development of a procedure for creating key poses, using several methods of non-rigid deformation and design of a 3D animation module compatible with the standard MPEG-4/AFX.PARIS5-BU Saints-Pères (751062109) / SudocSudocFranceF

    Compression de maillages 3D statiques et dynamiques

    No full text
    Les contenus 3D statiques et dynamiques sont aujourd'hui exploités à grande échelle dans le cadre d'applications multimédias professionnelles et grand public (CAO, télémédecine, jeux vidéo...). Cette thèse propose quatre approches originales de compression de maillages 3D : deux concernent les modèles statiques et les deux autres les modèles dynamiques. La première méthode, appelée TFAN (Triangle Fan-based compression), vise à assurer une compression efficace de maillages 3D, sous une contrainte de basse complexité de calcul du décodeur. Le codeur TFAN a été récemment (Avril 2008) retenu par le standard ISO/MPEG-4 pour une normalisation future. La deuxième approche est dédiée au codage des maillages 3D denses. Elle exploite une approximation (sans perte de connectivité) par surfaces BSplines, couplée à un codage JPEG2000. Elle offre des performances de compression efficaces à bas débit tout en assurant la fonctionnalité de scalabilité en qualité. La troisième technique, appelée MCGV (Multi-Chart Geometry Video), traite de la compression de maillages 3D dynamiques. MCGV exploite une représentation sous forme d'images géométriques 2D, compressées par les codeurs standardisés JPEG ou MPEG-4. L'approche MCGV assure de hautes performances de compression à bas débit et des fonctionnalités avancées (e.g., streaming, scalabilité...). Enfin, la quatrième contribution de cette thèse concerne la méthode de compression dite FAMC (Frame-based Animated Mesh Compression), fondée sur une stratégie de compensation du mouvement par modèle de peau. En raison de ses hautes performances de compression et de l'ensemble des fonctionnalités supportées, FAMC est promu dans le standard ISO/MPEG-4.Static and dynamic 3D meshes are widely exploited by professional and general public applications (e.g., CAD, telemedicine and video games). This Ph.D. thesis proposes four original approaches to compress 3D meshes: two of them handle static models and the other two the dynamic ones. The first method, called TFAN (Triangle FAN-based compression), aims at efficiently coding 3D meshes under a low decoder complexity constrain. The TFAN codec was recently retained (April 2008) for a future ISO/MPEG standardization. The second approach is dedicated to dense 3D meshes. It exploits a B-Spline approximation (with connectivity preservation) coupled with a JPEG2000 encoding. The B-Spline approach offers high compression performances for low bitrates while ensuring the functionality of quality scalability. The third technique, called MCGV (Multi-Chart Geometry Video), compresses dynamic 3D meshes. It exploits a geometry-images-based representation compressed by using the standard encoders JPEG and MPEG-4. The MCGV approach ensures high compression performances for low bitrates while supporting advanced functionalities (e.g., streaming and scalability). Finally, the fourth contribution of the Ph.D. thesis concerns the FAMC (Frame-based Animated Mesh Compression) compression method, which exploits a skinning-based motion compensation strategy. Because of its high compression performances and the complete set of functionalities it supports, the FAMC technique was promoted as an ISO/MPEG standard.PARIS5-BU Saints-Pères (751062109) / SudocSudocFranceF

    Quantification du remodelage bronchique en tomodensitométrie volumique

    No full text
    La possibilité d'analyser de manière précise et automatique la réactivité et le remodelage bronchique représente un enjeu clé de l'imagerie des voies aériennes. Le défi majeur est de fournir au praticien des outils pour un diagnostic fiable et pour le suivi des variations morphologiques des bronches, induites par les différentes pathologies affectant les voies respiratoires. Dans ce contexte, cette thèse a pour objectif de développer des techniques de quantification des calibres bronchiques et de les intégrer dans un système applicatif visant l'aide au diagnostic, le planning chirurgical, le choix et le suivi thérapeutique. La méthode développée repose sur une segmentation automatique des bords intérieur et extérieur de la paroi bronchique à partir d'examens tomodensitométriques (TDM) mise en œuvre, par une approche orientée modèle déformable. La spécificité du modèle tient à son initialisation forte au niveau de la lumière bronchique, à sa représentation géométrique et topologique adaptée à la morphologie bronchique suivant l'espace d'analyse choisi (2D, en section de coupe et 3D, volumique) et à la définition des forces impliquées dans la formulation discrète de la dynamique de déformation. Les nouveaux outils d'investigation bronchique qui en résultent sont ensuite testés et validés de manière quantitative sur des données TDM synthétiques et qualitativement sur des données cliniques. Les données synthétiques sont générées à travers le développement d'un simulateur TDM bronchique 3D, capable de reproduire des images volumiques réalistes de morphologies bronchiques complexes, paramétrables et parfaitement contrôlées. Enfin, un logiciel dédié à l'analyse morphologique des voies aériennes proximales est mis en place à partir des approches de quantification développées. Applicable en routine clinique, le logiciel propose une nouvelle appréhension des variations des calibres bronchiques en permettant d'afficher l'information relative à l'épaisseur pariétale en complément des techniques de visualisation standards (rendu de surface, bronchoscopie virtuelle).PARIS5-BU Saints-Pères (751062109) / SudocSudocFranceF
    corecore